# Organización del computador

Memoria

# Jerarquía de máquina

| Nivel 6 | Usuario                | Programa ejecutables                 |
|---------|------------------------|--------------------------------------|
| Nivel 5 | Lenguaje de alto nivel | C++, Java, Python, etc.              |
| Nivel 4 | Lenguaje ensamblador   | Assembly code                        |
| Nivel 3 | Software del sistema   | Sistema operativo, bibliotecas, etc. |
| Nivel 2 | Lenguaje de máquina    | Instruction Set Architecture (ISA)   |
| Nivel 1 | Unidad de control      | Microcódigo / hardware               |
| Nivel 0 | Lógica digital         | Circuitos, compuertas, memorias      |



- -> Cada nivel funciona como una máquina abstracta que oculta la capa anterior
- Cada nivel es capaz de resolver determinado tipo de problemas a partir de comprender un tipo de instrucciones específico
- -> La capa inferior es utilizada como servicio

# Von Newman / Turing





- \*Los programas y los datos se almacenan en la misma memoria sobre la que se puede leer y escribir
- \*La operación de la máquina depende del estado de la memoria
- \*El contenido de la memoria es accedido a partir de su posición
- \*La ejecución es secuencial (a menos que se indique lo contrario)

# Arquitectura de von Newmann

- → 3 componentes principales:
  - CPU: Unidad de control, Unidad Aritmética lógica, Registros
  - Memoria: Almacenamiento de programas y datos
  - Sistema de Entrada y Salida
- -> Procesamiento secuencial de instrucciones
- → Datos almacenados en sistema binario
- → Sistema de interconexión de componentes:



- Conecta la Unidad de Control con la Memoria mediante un camino único
- La unicidad del camino fuerza la alternación entre ciclos de lectura / escritura y ejecución
- Esta alternación se llama cuello de botella de von Newmann (von Newmann bottleneck)[\*]

## Problema 1

Velocidad de procesador vs. Velocidad de memoria



## Solución 1

Usar la memoria más rápida disponible



# Tipos de memoria

### ->Random Access Memory:

- ->Static RAM
- ->Dynamic RAM y Synchronic Dynamic RAM
- ->Non-volatile RAM

### ->Read Only Memory (ROM):

- ->Programmable ROM
- ->Erasable Programmable ROM
- ->Electronically Erased Programmable ROM

# Tipos de memoria

- ->Random Access Memory:
  - ->Static RAM
  - ->Dynamic RAM y Synchronic Dynamic RAM
  - ->Non-volatile RAM
- ->Read Only Memory (ROM):
  - ->Programmable ROM
  - ->Erasable Programmable ROM
  - ->Electronically Erased Programmable ROM

# SRAM vs. DRAM



# Métricas de análisis de una memoria

- -> Capacidad de almacenamiento: cantidad de (multiplos de) bytes que es capaz de almacenar
- ->Tiempo de acceso: tiempo requerido en (multiplos de) segundos necesario para leer/escribir en una posición
- -> Velocidad de transferencia: tiempo requerido en (multiplos de) segundos necesario para transferir (multiplos de) bytes
- ->Consumo de energía
- > Tamaño físico
- -> Costo total / costo por (multiplo de) bytes

- La información se almacena en un biestable como vimos en circuitos secuenciales
- → Una celda de memoria utiliza 6 transistores, 3 de los cuales consumen cantidad máxima de energía lo que produce un gran consumo
- La lectura es directa y no destructiva lo que las hace muy rápidas





- La información se almacena como una carga en un capacitor
- La lectura es indirecta pues se lee una carga de un capacitor y destructiva pues este se descarga
- -> Las cargas deben ser refrescadas periódicamente y cuando son leídas por lo que resultan muy lentas
- Tienen consumo mínimo ya que el transistor solo se activa para realizar la lectura



## Solución 1

Usar la memoria más rápida disponible

## Solución 1

Usar la memoria más rápida disponible



## Problema 2

### **SRAM**

- ->Alto consumo relativo.
- Capacidad de almacenamiento comparativamente baja.
- ->Costo por bit alto.
- ->Tiempo de acceso bajo (es mas rápida).
- Si construimos el banco de memoria utilizando RAM estática, el costo y el consumo de la computadora son altos.

### DRAM

- ->Consumo mínimo.
- ->Capacidad de almacenamiento comparativamente alta.
- ->Costo por bit bajo.
- Tiempo de acceso alto (lento), debido al circuito de regeneración de carga.
- ->Si construimos el banco de memoria utilizando RAM dinámica, no aprovechamos la velocidad del procesador.

## Estructura de bus clásica



- → La estructura de conexión de una unidad de proceso está (típicamente) conectada al resto de las componentes del sistema a través de un bus que consta de 3 tipos de señales (Control, Datos y Direcciones)
- -> Una memoria lenta hará que el procesador, de mayor velocidad, tenga que recurrir a ciclos de espera
- → Resulta inviable la utilización de SRAM para la construcción de la memoria del sistema

## Solución 2

### **Memoria Cache**

- ->Siendo la memoria principal un gran volumen de DRAM
- ->Se implementa un banco de SRAM de muy alta velocidad denominado cache, que contiene una copia de (algunos de) los datos e instrucciones que están en memoria principal
- ->El arte consiste en que esta copia esté disponible justo cuando el procesador la necesita permitiéndole acceder a esos ítems sin recurrir a wait states
- ->Requiere de hardware adicional que asegure que este pequeño banco de memoria cache contenga datos e instrucciones consistentes con los que está almacenado en la memoria principal

# Jerarquía de memoria



## Cache

- ->El tamaño de la memoria cache debe ser:
  - Suficientemente grande para que el procesador sea capaz de resolver la mayor cantidad posible de accesos en esta memoria sin recurrir a la memoria principal, asegurando una alta performance
  - Suficientemente pequeña para no afectar el consumo ni el costo del sistema
- ->Se dice que se logra un hit cuando se accede a un ítem (dato o código) y éste se encuentra en la memoria cache.
- ->En caso contrario, se dice que el resultado del acceso es un miss
- ->Se define hit rate = hit / #accesos
- ->Se espera un hit rate lo mas alto posible

## Cache read



# Principios de la Cache

- Uno de los principales problemas del uso de memorias Cache reside en la elección de la información a ser almacenada en ella
- ->Principio de vecindad espacial: si un item es utilizado es probable que los items cercanos en la memoria sean utilizados en el futuro cercano (por ejemplo, las posiciones de un arreglo)
- → Principio de vecindad temporal: si un item es utilizado es probable que sea utilizado nuevamente en el futuro cercano (por ejemplo, variables utilizadas como contadores en un ciclo)

# Principios de la Cache

### ->Ejemplo:

```
for (i = 0; i < 256; i++){
    suma = 0.0f;
    for (j = 0; (j <= i && j < 256); j++)
        suma += v0[i-j] * v1[j];
    fAux[i] = suma;
}</pre>
```

- La utilización de las variables suma, i, j responden al principio de vecindad temporal
- La utilización de los arreglos faux, v0, v1 responden al principio de vecindad espacial

# Organización de la Cache Mapeo directo



# Organización de la Cache Mapeo directo



## Organización de la Cache Mapeo asociativo de dos vías



# Organización de la Cache Asociativa de dos vías



# Organización de la Cache Completamente asociativa



# Política de reemplazo de contenido de la Cache

- Las políticas de reemplazo de contenidos en la Cache suelen tener una correlación con los principios que hacen que el contenido haya sido colocado en ella
  - ->Least recently used: se corresponde con el principio de vecindad temporal y prioriza aquellos contenidos que han sido utilizados recientemente
  - ->Least frequently used: se corresponde con el principio de vecindad temporal y prioriza aquellos contenidos que han sido más utilizados
  - ->FIFO (first in first out): se purgan los contenidos más antiguos

# Coherencia del contenido de la Cache

- ->Si una variable está en la memoria cache debe estar alojada en alguna dirección de la memoria principal
- ->Cuando se modifica un valor hay varios modos de actuar:
  - ->Write through: el procesador escribe en la memoria y el controlador de la memoria cache refresca el dato actualizado
  - ->Write through buffered: el procesador escribe en la cache, y el controlador de la memoria cache luego actualiza la copia en la memoria principal
  - ->Copy back: Se marcan las líneas de la memoria cache cuando el procesador escribe en ellas. Luego en el momento de eliminar esa línea de la memoria cache el controlador deberá actualizar la memoria principal

## Cache multinivel



# Ejemplos de Cache

- ->Intel 80486: una cache L1 on chip
  - -> Tamaño de la cahe: 8 Kbytes
  - -> **Tamaño de línea:** 16 bytes
  - -> Organización: asociativa de 4-vías
- ->Pentium: dos caches L1 on-chip (uno para datos y otro para instrucciones)
  - -> Tamaño de cada cahe: 8 Kbytes
  - -> Tamaño de línea: 32 bytes
  - -> Organización: asociativa de 4-vías
- ->PowerPC 601: una cache L1 on chip
  - -> Tamaño de la cache: 32 Kbytes
  - -> **Tamaño de línea:** 32 bytes
  - -> Organización: asociativa de 8-vías

# Ejemplos de Cache

- ->PowerPC 603: dos caches L1 on-chip (una para datos y otra para instrucciones)
  - -> Tamaño de cada cache: 8 Kbytes
  - -> **Tamaño de línea:** 32 bytes
  - -> Organización: asociativa de 2-vías (organización del cache más simple que en el 601 pero con un procesador mas potente)
- ->PowerPC 604: dos caches L1 on-chip (una para datos y otra para instrucciones)
  - -> **Tamaño de cada cache:** 16 Kbytes
  - -> **Tamaño de línea:** 32 bytes
  - -> Organización: asociativa de 4-vías
- ->PowerPC 620: dos caches L1 on-chip (una para datos y otra para instrucciones)
  - -> Tamaño de cada cache: 32 Kbytes
  - -> **Tamaño de línea:** 64 bytes
  - -> Organización: asociativa de 8-vías

# Tipos de memoria

- ->Random Access Memory:
  - ->Static RAM
  - ->Dynamic RAM y Synchronic Dynamic RAM
  - ->Non-volatile RAM
- ->Read Only Memory (ROM):
  - ->Programmable ROM
  - ->Erasable Programmable ROM
  - ->Electronically Erased Programmable ROM

#### DATA SHEET

NEC

### MOS INTEGRATED CIRCUIT

μ**PD43256B** 

### 256K-BIT CMOS STATIC RAM 32K-WORD BY 8-BIT

#### Description

The  $\mu$ PD43256B is a high speed, low power, and 262,144 bits (32,768 words by 8 bits) CMOS static RAM.

Battery backup is available. And A and B versions are wide voltage operations.

The μPD43256B is packed in 28-pin PLASTIC DIP, 28-pin PLASTIC SOP and 28-pin PLASTIC TSOP (I) (8 x 13.4 mm).

#### Features

- 32,768 words by 8 bits organization
- Fast access time: 70, 85, 100, 120, 150 ns (MAX.)
- Low voltage operation (A version: Vcc = 3.0 to 5.5 V, B version: Vcc = 2.7 to 5.5 V)
- Low Vcc data retention: 2.0 V (MIN.)
- /OE input for easy application

Diagrama de bloques



### **Read Cycle Timing Chart**

### Diagrama de tiempos



Remark In read cycle, /WE should be fixed to high level.

#### Write Cycle Timing Chart 2 (/CS Controlled)



Diagrama de tiempos

Cautions 1. /CS or /WE should be fixed to high level during address transition.

When I/O pins are in the output state, therefore the input signals must not be applied to the output.

**DATA SHEET** 

ELPIDA

MOS INTEGRATED CIRCUIT

MC-4R256FKE8D-840

Direct Rambus DRAM RIMM<sup>™</sup> Module 256M-BYTE (128M-WORD x 18-BIT)

#### Description

The Direct Rambus RIMM module is a general-purpose high-performance memory module subsystem suitable for use in a broad range of applications including computer memory, personal computers, workstations, and other applications where high bandwidth and low latency are required.

MC-4R256FKE8D modules consists of eight 288M Direct Rambus DRAM (Direct RDRAM) devices ( $\mu$ PD488588). These are extremely high-speed CMOS DRAMs organized as 16M words by 18 bits. The use of Rambus Signaling Level (RSL) technology permits 600MHz, 711MHz or 800MHz transfer rates while using conventional system and board design technologies.

Direct RDRAM devices are capable of sustained data transfers at 1.25 ns per two bytes (10 ns per sixteen bytes).

The architecture of the Direct RDRAM enables the highest sustained bandwidth for multiple, simultaneous, randomly addressed memory transactions. The separate control and data buses with independent row and column control yield over 95 % bus efficiency. The Direct RDRAM's 32 banks support up to four simultaneous transactions per device.

#### **Features**

- 184 edge connector pads with 1mm pad spacing
- 256 MB Direct RDRAM storage
- Each RDRAM® has 32 banks, for 256 banks total on module
- Gold plated contacts
- DDDAMa usa Chin Saala Daakasa (CSD)

## Memoria OTP<sup>[\*]</sup> EPROM

### **Features**

- Fast Read Access Time 90 ns
- Dual Voltage Range Operation
  - Low Voltage Power Supply Range, 3.0V to 3.6V or Standard 5V  $\pm$  10% Supply Range
- Compatible with JEDEC Standard AT27C512R
- Low Power CMOS Operation
  - 20  $\mu$ A Max (Less than 1  $\mu$ A Typical) Standby for  $V_{cc}$  = 3.6V
  - 29 mW Max Active at 5 MHz for V<sub>cc</sub> = 3.6V
- JEDEC Standard Packages
  - 32-lead PLCC
  - 28-lead SOIC
  - 28-lead TSOP
- High Reliability CMOS Technology
  - 2,000V ESD Protection
  - 200 mA Latchup Immunity
- Rapid Programming Algorithm 100 μs/Byte (Typical)
- CMOS and TTL Compatible Inputs and Outputs
  - JEDEC Standard for LVTTL
- Integrated Product Identification Code
- Industrial Temperature Range
- Green (Pb/Halide-free) Packaging Option



512K (64K x 8) Low Voltage OTP EPROM

AT27LV512A



## Memoria EEPROM

#### **Features**

- 2.7V to 3.6V Supply
  - Full Read and Write Operation
- Low Power Dissipation
  - 8 mA Active Current
  - 50 μA CMOS Standby Current
- · Read Access Time 300 ns
- Byte Write 3 ms
- Direct Microprocessor Control
  - DATA Polling
  - READY/BUSY Open Drain Output
- High Reliability CMOS Technology
  - Endurance: 100,000 Cycles
  - Data Retention: 10 Years
- JEDEC Approved Byte-Wide Pinout
- Commercial and Industrial Temperature Ranges

### Description

The AT28BV64 is a low-voltage, low-power Electrically Erasable and Programmable Read Only Memory specifically designed for battery powered applications. Its 64K of memory is organized 8,192 words by 8 bits. Manufactured with Atmel's advanced nonvolatile CMOS technology, the device offers access times to 200 ns with power dissipation less than 30 mW. When the device is deselected the standby current is less than 50  $\mu\text{A}.$ 



64K (8K x 8)

Battery-Voltage<sup>™</sup>

Parallel

EEPROMs

AT28BV64

## Memoria Flash

#### **Features**

- . Single Supply Voltage Range, 2.7V to 3.6V
- Single Supply for Read and Write
- · Fast Read Access Time 90 ns
- Internal Program Control and Timer
- 8K Bytes Boot Block with Lockout
- Fast Erase Cycle Time 10 Seconds
- Byte-by-byte Programming 30 μs/Byte Typical
- Hardware Data Protection
- DATA Polling for End of Program Detection
- · Low Power Dissipation
  - 25 mA Active Current
  - 50 µA CMOS Standby Current
- Typical 10,000 Write Cycles
- . Green (Pb/Halide-free) Packaging Option

#### Description

The AT49BV512 is a 3-volt only, 512K Flash memories organized as 65,536 words of 8 bits each. Manufactured with Atmel's advanced nonvolatile CMOS technology, the devices offer access times to 90 ns with power dissipation of just 90 mW over the commercial temperature range. When the devices are deselected, the CMOS standby current is less than 50 μA.

To allow for simple in-system reprogrammability, the AT49BV512 does not require high input voltages for programming. Three-volt only commands determine the read and programming operation of the device. Reading data out of the device is similar to reading from an EPROM. Reprogramming the AT49BV512 is performed by erasing the entire 1 megabit of memory and then programming on a byte-by-byte basis. The typical byte programming time is a fast 30 µs. The end of a program cycle can be optionally detected by the DATA polling feature. Once the end of a byte program cycle has been detected, a new access for a read or program can begin. The typical number of program and erase cycles is in excess of 10,000 cycles.



512K (64K x 8) Single 2.7-volt Battery-Voltage Flash Memory

AT49BV512